1
現実からデータへ:科学的サンプリングの論理と方法
MATH1002CA-PEP-CNLesson 4
00:00
標本現実の母集団から科学的な標本への推論
統計学は、データを収集・分析することで現象を理解するための科学です。現実社会では、すべての対象を調査することはできません。そのため、『サンプリング』によって一部のデータから全体を推測し、科学的な推論を行う必要があります。

1. 統計調査の基本用語

  • 全数調査(人口調査): 調査対象となるすべての個体に対して調査を行う方法。
  • 標本調査(サンプリング調査): 母集団から一部の個体を抽出して調査を行い、その結果に基づいて母集団の状況を推定・推論する方法。
  • 母集団(Population): 調査の対象となるすべての個体の集合。
  • 個体(Individual): 母集団を構成する、各々の調査対象。
  • 標本(Sample): 母集団から抽出された部分の個体。
  • 標本量: 標本に含まれる個体の数。

2. データ収集の多様な手段

直接調査(例:人口調査)でデータを取得する他にも、以下の方法が利用できます:

  • 実験: 統計学において、実験の設計に関する学問を『実験計画』と呼びます。
  • 観察: 自然な状態のまま情報を収集すること。
  • 調査(リサーチ): 過去に誰かがすでに収集したデータを入手する。このようなデータを二次データと呼びます。
標本にはランダム性があるため、標本から母集団を推定する際には、統計的推論結果に確率性(あるいは不確実性)(つまり誤差が生じる可能性がある)が伴います。この点は、統計結果を実際に問題に応用する際に特に注意すべきことです。
比例式:$\frac{n}{N} = \frac{\text{層の標本量}}{\text{各層の母集団量}}$